
《思辨賽局》:用逆推的方式找到不同時期的納許均衡,玩好人生賽局
2025 Aug 14 經濟學
前言
賽局理論是一種重要的經濟學理論,專門研究「策略互動」的情境,關注不同參與者的利益如何交織影響彼此的決策。無論是兩個人在桌上玩取旗遊戲、國際間談判貿易條件,本質上都是一場賽局。
這本《思辨賽局》的作者有兩位,分別是普林斯頓大學經濟學教授阿維納什.迪克西特(Avinash Dixit)及耶魯大學管理學院講座教授貝利.奈勒波夫(Barry J. Nalebuff),他們結合了賽局理論的科學推演與現實世界的應用思考,將原本艱澀難懂的賽局理論,化為生動有趣的實例。他們不僅介紹了賽局理論的基礎概念,也透過經典的「逆推法」,與我們分享如何在逐步行動的賽局當中做出最有利的決策。
在接下來的分享中,我會先簡單介紹什麼是納許均衡以及逆推法,並探討賽局理論如何應用在人生規劃上,成為形塑個人未來的重要關鍵。
讓我們從賽局理論的重要概念-納許均衡-開始吧!
納許均衡
在賽局理論中,納許均衡(Nash Equilibrium) 是一種穩定狀態,指的是在所有參與者都已選擇好策略後,沒有任何一方會單獨改變自己的策略,因為改變會降低報酬。
簡單來說,納許均衡有兩個核心條件:
- 每個參與者都選擇了對其他參與者策略的最佳回應。
- 每個參與者對其他人的預期都是正確的。
書中舉了許多納許均衡的例子,這裡以襯衫定價為例。
A 和 B 兩家生產襯衫成本相同的公司「同時」為襯衫定價,定價範圍從 38 美元到 42 美元。
- 當 A 認為 B 會定價 40 美元時,A 選擇 40 美元是最佳回應(此時利潤為 $40,000)。
- 當 B 認為 A 會定價 40 美元時,B 選擇 40 美元也是最佳回應(此時利潤同樣為 $40,000)。
在這個情境下,兩家公司都選擇 40 美元時,形成了一個穩定的組合。因為此時如果任一家公司單獨改變價格,它的利潤並不會增加,反而會減少。因此,這兩家公司都沒有改變策略的動機,這個「雙方都定價 40 美元」的組合就是一個納許均衡。
可以想像得到的是,納許均衡不一定是雙方最有利的選擇,他們大可以談成某種協議,將定價定的更高,這可使他們的獲利大大增加。但同時,他們也都有動機背叛,例如將價格調降,吸引更多對方的客戶,以獲得更大的利益。
但當定價在上述的 40 美元時,雙方不管是調升或調降價格,都無法使利潤變多,甚至只會變少。價格調升的話,理所當然地會流失客戶;而將價格調降的話,雖然客戶變多,但一單位的獲利會減少,增加的收益可能也無法彌補價格戰帶來的損失。
這就是納許均衡:我對你的選擇做了最佳回應,而你對我的選擇也做出最佳回應,而這兩個最佳回應剛好重合。
逆推可解-逐步行動賽局
逐步行動賽局是書中提到眾多賽局中的其中一個,顧名思義是指參與者輪流行動,每人決策依賴前一步並影響後續的策略互動情境。這種賽局的核心在於雙方更加相互依存:你的選擇影響對手的接下來的反應,反過來影響你的未來機會。
對此,作者提出了「向前預測,倒後推理」的思維方式,作為解決這類賽局的根本法則,也就是逆推、逆向歸納。這方法從想像賽局最終結局倒推至起始點,逐步確定每個階段的最佳選擇。
逆推只適用於沒有重大不確定性的逐步賽局,且滿足以下條件:
- 資訊透明:雙方清楚當前局勢。
- 目標已知:知道對手追求什麼。(你必須真正站在他們的立場思考,而不是假設他們會做出你認為最理性的選擇。這意味著你必須掌握他們所掌握的資訊,並以他們的目標為出發點進行推論。)
- 行動可觀察:可在對方行動後再決策。
如果存在策略不確定性(如目標不明、動作隱藏、反應過快),逆推就失效,因為你沒有資訊預測對方的行動,導致也無法依照他的動作思考出自己的最佳策略。
21 支旗遊戲是作者舉的一個經典例子。
兩部落輪流從旗堆取 1 至 3 支,不可不拿,最後取旗的部落勝。
賽局無不確定性:剩餘旗數、對方目標(取最後旗)清楚,且行動可觀察。
從終局逆推:
剩 1 支,輪到者取勝;
剩 2 支,輪到者取 2 支勝;
剩 3 支,輪到者取 3 支勝;
剩 4 支,無論取幾支,留 1 至 3 支給對方,對方勝,得知剩 4 是輸位。
剩 5 支,取 1 留 4 支(對方輸,你勝)。
可推論出贏位是剩下的旗除以 4 餘 1、2、3,而輸位是可以整除 4 。
起始 21 支,假如你先取 1 支留 20 支(輸位),後續繼續讓對方面對 4 的倍數的旗數,你就能贏得勝利。
同樣的方式可以應用到各式各樣的逐步行動賽局當中,找出每一步的最佳策略。
然而,許多現實中的賽局,例如象棋,複雜度遠遠超過我們單純靠逆推就能解決的範圍。象棋的決策點數量龐大,即使是最強大的超級電腦也很難完整地分析。
面對這種情況,單純的逆推法變得不切實際。這時,我們需要將賽局理論的科學與實戰經驗結合起來。在能預測的範圍內,盡可能地使用逆推的方法。當超出預測範圍時,則依靠我們自身經驗、直覺和對局勢的判斷力。單純依靠賽局理論能讓你擁有不錯的勝率,但假如你想成為大師,你還是必須有豐富的經驗。
我的想法
逆推可解的逐步行動賽局,雖然只適用於沒什麼重大不確定的賽局,但我想同樣的逆推方式也可以應用在人生的單人賽局。這是一種「以終為始」的概念,以最終你想要成為的樣子,逆推到現在每一步你該怎麼做。
舉個例子,假如你想去墨爾本的維多利亞州立圖書館旅遊,你完全可以逆推你前往圖書館的每個步驟。首先你要到桃園機場搭飛機到墨爾本;接著你搭機場巴士到墨爾本市區;再來是去對面的車站搭輕軌;最後則是走幾步路成功抵達圖書館前的草地。
接下來,我們來想像要完成每一個步驟的方式有哪些。
從桃園機場到墨爾本機場,你可以搭直飛的航班,可以到香港、新加坡、吉隆坡、曼谷杜拜等地轉機,甚至是繞遠路的杜拜、洛杉磯也都可以「中轉一次」到墨爾本(當然應該不會有人這樣做)。你也可以選擇先飛到雪梨、黃金海岸、凱恩斯、伯斯等澳洲的城市玩個幾天再去墨爾本,或是先去紐西蘭。除了搭飛機以外,搭船也是一個慢活的選擇。
接著,從墨爾本機場或是港口到市區,你的選擇有機場巴士、輕軌、火車、計程車等,應該不會有人想走路吧?
到市區後,離圖書館越來越近了。你的選擇大概剩下輕軌、計程車和走路。
到了圖書館前 50 公尺,基本上你只會選擇走路了。(除非你跟朋友打賭輸了,明明在圖書館前,還去搭計程車繞了十分鐘才回來)
你有發現嗎?越接近目的,你的選擇越少。
人生賽局也是。
請想像職涯賽局。
30 歲時,你可以多方嘗試,大多數的公司因為你還年輕,只要態度良好可能都有意栽培。
40 歲時,你逐漸累積專業,假如你突然對目前的工作沒興趣,考量到你的經驗,跳到類似的產業可能有機會。
50 歲時,你大概已經是公司的中流砥柱,同樣產業的工作機會也都歡迎你。但要轉換產業已經漸漸變得困難。
60 歲時,你是公司的管理高層,你賺很多錢,但假如有一天對管理事業沒有興趣,可能也沒有公司有意願從頭栽培你了。這時你的選擇變得很有限。你可以選擇繼續待在公司管理階層,不然就是選擇退休,用之前的積蓄去做自己想做的事。
雖然人生這個牌局在進棺材前都還沒有結束,一局結束了還有下一局,但時間的窗口會變小,選擇也會越來越少。
也因此我們常聽到的投資法則才會這麼說,越年輕承受的風險越高,可以用比較冒險、激進的投資組合,減少債券的持有比例。
同理,在任何任務的初期,我們都比較有本錢冒險,做一些高風險、高報酬的決策,因為我們還有時間挽救。但當期限將至,面對完成任務的壓力,就只能以最保守的方式以確保任務完成了。
回到逆推人生賽局,你有想過你的理想生活嗎?10 年後、20 年後,甚至是 30 年後,你想成為什麼樣子?
盡快從那個目標逆推到今年、這個月、這週、今天要做什麼吧!因為越快計劃,我們越有本錢冒險,也能擁有更多選擇。
最後,你有想過現在的你與未來那個達成目標的你,其實也存在一種賽局關係嗎?
假設你想在 20 年後成為某上市公司的 CEO。
在一年後的 2026 年,針對你的目標,你會怎麼做才能最大化你的報酬?而未來的你會覺得在 2026 年時應該怎麼做才是最好的?有沒有其他事情在影響著你往目標前進?
而 5 年後、10 年後、15 年後呢?
找出現在的你與未來的你每階段的納許均衡吧!最大化你的努力,玩好人生賽局。